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(57) Abstract 

The invention relates to a new gene which codes for UDP-N-acetyl gtucosaminyl: 'beta'1,4 gaiactoside: ' beta' 1.3(N -acetyl 
glucosamine transferase (3GnT). Its enzymatic activity and specificity differ from those of all glycosyi transferases published 
so far. The invention further relates to isolated DNA molecules and constructs, including their derivatives, which code for 3GnT 
(referred to as 3GnT-DNA), cloning and expression vectors containing the above 3GnT-DNA, cells transfected with said vectors and 
recombination methods for obtaining said DNA. The invention also relates to a method for the synthesis of di- ( oligo- and 
polysaccharides with the repetitive element N-acetyl glucosamine ( , beta'1}3)galactose( , beta , 1}4) by obtaining and using the 
recombinant enzyme from transfected cells which were transfected with 3GnT-DNA, including its derivatives. The invention also 
relates to methods for diagnosing genetic changes in animals and humans and to the production of antisense samples and targeting 
vectors for producing transgenic animals. 

(57) Abrege 

L'invention concerne un nouveau gene qui code pour la UDP-N-acetylglucosaminyl: 'beta'1,4 gaiactoside: 'beta'1,3N- 
acetylglucosaminyltransferase (3GnT) et dont I'activite enzymatique et la specificite different de celles de toutes les 
glucoisyttransferases publiees a ce jour. L'invention concerne des molecules et structures d'ADN isolees, y compris leurs derives, 
codant pour la 3GnT (designee comme 3GnT-ADN); des vecteurs de clonage et d'expression contenant cette 3GnT-ADN ainsi que 
des cellules transferees par ces vecteurs et des procedes de recombinaison permettant d'obtenir cet ADN. L'invention concerne 
egalement un procede de synthese de di-, oligo-, polysaccharides ayant I'element repetitif N-acetylglucosamine ('beta'1}3) 
Galactose ('beta'1}4) en obtenant et utiltsant I'enzyme recombinant a partir de cellules transferees par la 3GnT-ADN, y compris 
ses derives. L'invention concerne egalement un procede permettant de diagnostiquer des moditrfl cations genetiques chez I'homme et 
les animaux, la production d'echantillons antisens et de vecteurs de _ciblage _ permettant de produire des animaux transgeniques. 
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(57) Abstract 



The invention relates to a new gene which codes for UDP-N-acetyl glucosaminyl: 01,4 galactoside: 0 1 ,3(N-acetyl glucosaminyl 
transferase (3GnT). Its enzymatic activity and specificity differ from those of all glycosyl transferases published so far. The invention further 
relates to isolated DNA molecules and constructs, including their derivatives, which code for 3GnT (referred to as 3GnT-DNA), cloning 
and expression vectors containing the above 3GnT-DNA, cells transacted with said vectors and recombination methods for obtaining said 
DNA. The invention also relates to a method for the synthesis of di-, oligo- and polysaccharides with the repetitive element N-acetyl 
glucosamine (0l->3)galactose(01— 4) by obtaining and using the recombinant enzyme from transfected cells which were trans fected with 
3GnT-DNA, including its derivatives. The invention also relates to methods for diagnosing genetic changes in animals and humans and to 
the production of antisense samples and targeting vectors for producing transgenic animals. 

(57) Zusammenfassung 

Gegenstand der Erfindung ist ein neues Gen, welches fur die UDP-N-Acetylglukosaminyl: 01,4 Galaktosid: 
01 t 3N-Acetylg!ukosaminyltransferase (3GnT) kodiert. Die enzymatische Aktivitat und Spezifitat ist von alien bisher pur> 
Iizierten Glykosyl trans ferasen verschieden. Die Erfindung umfasst isolierte DNA-Molekulc und -Konstrukte einschliesslich ihrer 
Derivate, wclcbe fUr die 3GnT kodieren (als 3GnT-DNA bezeichnetj, wie auch Klonierungs- und Expressionsvektoren, welche diese 
3GnT-DNA enthalten, sowie Zellen, welche mit diesen Vektoren transfektiert sind und Methoden der Rekombination zur Gewinnung 
dieser DNA. Die Erfindung betrifft zudem Verfahren zur Synthese von Di-, Oligo- und Polysacchariden mit dem repetitiven Element 
N-acetylglukosamin(0t-^3)Galaktose(01-^4) durch Gewinnung und Anwendung des rekombinanten Enzyms aus transfektierten Zellen, 
die mit 3GnT-DNA, einschliesslich ihrer Derivate, transfektiert sind. Die Erfindung umfasst auch Verfahren zur Diagnose genetischer 
Anderungen bei Her und Mensch, der Herstellung von Antisense-Proben und 'Targeting" Vektoren zur Erzeugung genveranderter Tiere. 
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UDP^V-A2er\-lelukosaminvi:(3I.4 Galaktosid: B1.3A/-Azetvlglukosaminvltrans- 
ferase fPolvIaktosarriinvl Tvd) 

Technisches Gebiet 

Die vorliegende Erfmdung betrifft das Gebiet C (Chemie, Huttenwesen). Im engeren Sinn betriffi 
die Erfmdung das Gebiet der Biotechnologie und der rekombinanten DNA-Technik. Die Erfm- 
dung betrifft die Klonierung einer Nukleinsaure, welche fur eine neuartige Glykosyltransferase 
kodiert. Die Glykosyltransferasen zahlen zu derjenigen Klasse von Enzymen, welche an den Gly- 
kosylierungsmechanismen beteiligt sind. Diese gehbren zu den wichtigsten biosynthetischen Ei- 
genschaften der lefaenden Zelle und und sind vor allem an posttranslatorischen Veranderungen von 
Proteinen beteiligt. Zudem beruhren die erfindungsgemassen Nukleinsauren auch die Synthese der 
CHykosaminoglykane (oder, synonym dazu, Proteoglykane). 

Im Besonderen betrifft die Erfmdung eine Familie von ahniichen DNA'-Sequenzen (Nukleinsau- 
ren), von welchen eine die Spezifitat aufweist, welche sie zusammen mit einer 
PMGalaktosyltransferase (Almeida, R. et al., J. Biol. Chem. 1997, 272, 3 1979-91; Sato T., et al. 
Proc. Natl. Acad. Sci. USA 1998, 95, 472-7; Sato T. et al. Biochem. Biophys Res. Commun. 
1998, 244, 637-641) zur Synthese von Polyiaktosaminoglykanen bzw Keratan befahigt. Die Er- 
fmdung bezieht sich auf das Gen, die daraus in vitro abgeleitete cDNA, DNA Konstrukte mit ahn- 
licher Aktivitat. rekombinante Plasmide. welche dieses Gen, bzw. cDNA enthalten, sowie Pro- 
duktionsplasmide zur Herstellung des rekombinanten Enzyms mit Hilfe der Transfektion und 
Transformation sowie alle Methoden zur Identifikation von Polymorphismen bei Menschen und 
Tieren und der Herstellung von Antisense-Polynukleotiden und sogenannten Targeting Vektoren 
zur Herstellung von genveranderten Tieren. 



1 DNA* In diescm Schriftstiick stchl DNA fur Dcovvnbonuclcic Actd. zu dcmsch Dcsox>ribormklcins.iurc 
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Stand der Technik 

Alle Ltreraturzitate in diesem Schriftstuck beziehen sich auf die Gesamtheit derzitierten Literatur- 
stelle. 

Die Giykosylierung ist eine der wichtigsten posttranslatorischen Veranderungen der kovalenten 
Proteinstruktur uberhaupt. Sie beginnt nach der eigentiichen ribosomalen Proteinsynthese und der 
Translocation dcs neugebildeten Proteins in das endoplasmatische Reticulum durch die Uebertra- 
gung eines prafomierten Oligosaccharids (Glc 3 Man 9 GlcNAc 2 ) 2 auf das Protein. Dieser Mechanis- 
mus, der in der Evolution von der Backerhefe bis zum menschiichen Organismus sehr ahnlich ab- 
lauft und unter dem BegrirT der A^-Glykosylierung in der Literatur eingehend beschrieben ist (Gly- 
coproteins, Montreuil J , Vliegenthan. J.F.G. & Schachter, H.. Hsg. Elsevier, Lausanne, 1995), 
bildet die Vorstufe zum Glykosylierungsprozess, welcher im Golgi-Apparat stattfindet. Im Golgi 
Apparat findet zudem nocb die sog. O-Glykosyiierur.g statt. Die Giykosylierungsprozesse im Gol- 
gi-Apparat fuhrt zur Ausbildung spezifischer Glykanstrukturen, welche bei zahlreichen biochemi- 
schen und physiologischen Phanomenen beteiligt sind (Varki, A., Glycobioiogy 1993, 3, 97-130). 
Sowohl 0- wie A/-gebundene Glykane weisen in gewissen Zellen und bei bestimmten Entwick- 
lungsstufen verlangerte Antennen auf, welche aus der Repetition eines Disaccharid-Motivs entste- 
hen, namJich des GalpMGlcNAcPUGaiPMGIcNAc 3 (Glycoproteins and Disease, Montreuil J., 
Vliegenthan, J.F.G. &. Schachter, H., Hsg,. Elsevier, Lausanne, 1996). Dieses Motiv fuhrt in va- 
riabler Lange zu einer Struktur, welche zusammenfassend ais Polylaktosaminogiykane bezeichnet 
werden Die gleiche Struktur findet sich als Glykangrundgerust im Keratan, einem Glykosamino- 
gjykan mit bestimmter Verteilung im Organ (Cornea. Knorpei) (Roden L. in The Biochemistry of 
Glycoproteins and Proteoglycans, Lennarz, W.I., Hsg, Plenum Press, New York, 1980, S 314- 
318) 

Die Polylaktosaminogiykane sind auch bei krankhaften Prozessen gefunden worden, wie bei der 
viral en Transformation von Zellen (Kobata A. in Glycoproteins and Disease, Montreuil J., Vlie- 
genthart J.F.G. & Schachter, H„ Hsg,. Elsevier, Lausanne, 1996, S 21 1-227 ) und bei der Karzi- 
nogenese (Yarnashita K. & Kobata A., ibidem, S 197-210). Maligne transformierte Zellen erwer- 
ben neuartige Adhasions und Erkennung-Eigenschaften im Verbund mit anderen Zellen (Metasta- 

: GIcjNLin/GlcNAc; heissi GlukosCjMannose^nzetylg]iiko»min : 

* GalpI.4GlcNAcp[.3Galfil.4GlcNAc hcissl Galakiosc(U=i4 V-azet\lfilukosnium0I.3 Galaktosc31=^.Y- 
a^etyl^lukos:inHn 
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sierung und Invasivitat), bci welchen das Glykanmuster der malignen Zelle von grosser Bedeutung 
ist (Yamashita K. & Kobata A , ibidem, S. 229-239). 

Bei der Entstehung dcr Entzundung spielen Glykan-Selectin Wechselwirkungen eine entscheiden- 
de RoIIe: So ist beschrieben worden, dass Leukocyten ein Glykoprotein enthalten (PSGL-l) 4 , 
5 welches eine bestimmte (9-elykosidische Struktur aufweist, welches Polylaktosaminoglykane em- 
halt (Liu. W. et al., J. Biol. Chem. 1998, 273. 7078-7087). Diese sind bei der Erkennung des P- 
Selectins auf der endotheliaJen Oberflache der Gefasse, weiche das entzundete Gebiei versorgen, 
15 beteiligt (McEver, and Cummings, R.D., J. Clin. Invest. 1997, 100, 485-492}. Deshaib fokus- 

sieren einige pharmazeutische Firmen ihre Anstrengungen auf das Gebtet dieser Wechselwirkung, 
1 0 mit dem Ziel, spezifische Inhibitoren zu entwickeln. 

Daraus ergibt sich ein Amvendungsgebiet dieser Enzyme, weiche in vivo an der Synthese biospe- 
20 zifischer Erkennungsstrukturen beteiligt sind: Sie kbnnen fur die in vitro Synthese ahnlicher 

Strukturen nutzbar gernacht werden. 

Ein weiteres Amvendungsgebiet liegt in der Herstellung von Glycosaminoglycanen (Proteoglyca- 
15 ne). Diese bilden einen wesentlichen Teil der extrazellularen Matrix. Zu diesen StofTen zahit Ke- 
ratin und seine Derivate. Diese enthalten im Glycanteil als Bauelement das Disaccharid N- 
Azetylgiukosaminpl=>3Galaktosepl^4. Dieses Disaccharid bildet als repetitives Struktur- 
elemem Glykanketten von variabler Lange. Diese konnten bisher in vitro enzymatisch nicht syn- 
30 thetisiert werden, da das Enzym, welches efhzient die W-Azety!glukosamin31=>3Galaktose Bin- 

20 dung katalysiert, nicht verfligbar war. 
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Beschreibung der Erfindung 

Die vorliegende Erfindung beschreibt die Isolierung humaner und muriner DNA, welche fur die 
irDP-A'-Azetylgiukosaminyl;j3l,4 Galaktosid: [M,3Af-Azetylglukosaminyitransferase (Polylaktos- 
arninyl Typ T nachfolgend kurz als 3GnT bezeichnet) kodiert mit der zugehorigen cDNA und der 
genomischen DNA. Die Spexifitat des Enzyms bezieht sich auf das Donor-Substrat (UDP-N- 
Azetylglukosamin) und das Akzeptorsubstrat jV-Azetyilaktosamin und alle Glykokonjugate, wel- 
che diese Struktur terminal exponieren. 
Die komplette Nukeotidsequenz ist auf Abb. 1 angegeben. 

Eine erste Ausfuhrungsform der Erfindung betrifft die NukJeotidsequenz der humanen Variante 
Nukleotid 1 bis 990 (Seq ID-Nr. la), welche als konservien bezeichnet wird und alle Funktions- 
konservierten Sequenz-Varianten. Eine zweite Ausfuhrungsform der Erfindung betrifft die Nu- 
kJeotidsequenz der murinen Form des Enzyms (Seq ID-Nr. lb) und alle Funktions-konservierten 
Sequenz-Varianten. Auch betrifft die Erfindung isoliene Nukleinsauren, welche mit den Sequen- 
zen Nr. 1 hybridisieren konnen einschliesslich daraus abgeleitete Fragmente oder Varianten mit 
konservierter Sequenz oder Funktion. Unter Hybridisierung sind auch Bedingungen eingeschlos- 
senen, welche einer mittleren Stringenz entsprechen. 

Eine dritte Ausfuhrungsform entspricht der Sequenz des humanen Proteins, welches durch 
Translation 5 der erfindungsgemassen Nukleinsauresequenz entsprechend der Seq ID-Nr. la er- 
halten wird. Diese Aminosauresequenz (Seq ID-Nr.2a) ist durch das offene Leseraster (ORF. 
open reading frame) definiert mit Beginn beim Met, (Aminosaure 1) bis Pro 32 9, (Aminosaure 329) 
In einer vierten Ausfuhrungsform entspricht die murine Sequenz (Seq ED Nr. 2b) derjenigen der 
Aminosauren mit Beginn beim Meti (Aminosaure I) bis Proju (Aminosaure 325), welche durch 
das offene Leseraster der erfindungsgemassen Nukleinsauresequenz entsprechend der Seq ED 
Nr. lb definiert ist. 

In einer funften Ausfuhrungsform der erfindungsgemassen Sequenz Seq ID Nr. 2a beginnt die 
Sequenz bei Argji bis Aminosaure Pro^Seq ID Nr. 3a). In einer sechsten Ausfuhrungsform der 
erfindungsgemassen Sequenz Seq ID Nr. 2b beginnt die Sequenz bei Arg^ bis Aminosaure Pron; 
(Seq ID Nr. 3b). 



s Unter Translation wird in diescm Sclinflstuck cine kolineare Obersctzung der Nukleinsaiircsequcnz in emc Ami- 
nosauresequenz entsprechend dem universe! len genetischen Code bczcichnci. 
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In einem damit zusammcnhangenden Aspekt beschreibt die Erfindung DNA-Konstrukte, welche 
die 3GnT-Scqucnzen emhalten, einschliesslich aber nicht ausschliesslich solcher, welche die 3GnT 
Sequenz mit einer transkriptions-regulatorischen Sequeru mit oder ohne Polyadenyiierungssignal 
verknupft Solche DNA-Konstruktc weren auch als " Vekioren" bezeichnet. Zellen. welche mit 
diesen Vektoren transient oder stabil transfektiert sind, sind in der Beschreibung eingeschJossen 
Ebenso Viren und Bakteriophagen, welche die 3GnT-Sequenzen enthalten, sind in der Beschrei- 
bung eingeschJossen. Die Erfindung schliesst auch die Methoden zur Produktion von 3GnT Poly- 
peptiden ein, Diese beruhen a) auf der Einflihrung des 3GnT Gens, bzw. cDNA oder eines davon 
abgeleiteten Konstruktes in eine Wirtszelle; b) die fur die Gewinnung eines aktiven und/oder im- 
munoreaktiven rekombinanten 3GnT-Polypeptids geeigneten Bedingungen sowie c) fur die Isolie- 
rung des rekombinanten Produktes. Ebenso schliesst die Erfindung die Herstellung einer Zellinie 
ein, welche die 3GnT stabil exprimiert unter Einbezug des dazu erforderlichen Transfers der 
cDNA ensprechend der Sequeruen gemass Seq ID Nr. la, bzw lb, oder eines Fragmentes dieser 
cDNAs, welche fur ein Protein entsprechend der Sequenz 2a, bzw 2b codiert oder eines Frag- 
mentes, das enzymatisch aktiv ist oder sich zur Kristatlisierung eigne:. Eingeschlossen sind die 
Bedingungen zur Selektion und zum Wachstum der die 3GnT exprimierenden Wirtszellen sowie 
zur ihrer Idemifikation. Diese Zellen konnen zur Herstellung des rekombinanten Enzyms ge- 
braucht werden, das als Katalysator zur Herstellung von Glykanen verwendet werden kann. Diese 
cDNA kann auch dazu verwendet werden, Zell-Linien oder ex vivo gewonnene Zellen stabil zu 
transfektieren und damit ihre Adhasions- und Erkennungseigenschaften zu verandem. Auch kon- 
nen solchermassen stabil transfektiene Zellen zur Expression von Glykoproteinen eingesetzt wer- 
den, welche durch die Expression der 3GnT mit Polylaktosaminoglykanen substitutiert werden 
Auch sind alle Anwendungen zur Herstellung von Keratan und seiner Derivate eingeschlossen. 
Ein weiterer Aspekt der Erfindung betrifft die Isolierung von 3GnT Polypeptiden, welche die Se- 
quenzen Nr. 2a und 2b bzw. 3a und 3b oder funktionskonservierte Teile derselben enthalten oder 
emsprechende Sequenzen, die mit einem weiteren Peptid im Leseraster fusioniert sind. Unter die- 
sen Peptiden sind ohne Ausschliesslichkeit speziell diejenigen bevorzugt, welche fur die Reinigung 
der rekombinanten 3GnT hilfreich sind. 

Ein anderer Aspekt der Erfindung betrifft die Methoden, welche zur Entdeckung von Mutationen 
in der codierenden Region des Gens gebraucht werden, indem genomische DNA von Patienten 
beispielsweise aus Blutzellen analysiert wird. In einer Ausfuhrungsform umfasst das Verfahren die 
Isolierung der Patienten-DNA, die Amplication mittds PCR von Exonabschmtten des 3GnT- 
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Gens, die Sequenzierung des amplifizierten Abschnittes und die Feststellung einer moglichen 
Struktur- oder Promotorrnutation und die Verknupfung mit der Pathogenese der KLrankheit. 



Detaillierte Darstellung der Erfindung 

Definitionen: 

1 "Nukleinsauren" oder "Polynukieotide" bezeichnen in diesem Schriftstuck Polymere aus Purin- 
und Pyrimidinbasen einer beliebigen Lange, entweder als Polyribonukleotide, Polydesoxyribonu- 
kieotide oder Mischungen beider. Diese umfassen Einzel- und D op pel strange, beispielsweise 
DNA-DXA, DN'A-RJs'A und RNA-RNA-Hybride. Ebenso sind atypische Basen miterwahnt. 

2. "cDNW (Kopie DNA oder Komplementare DNA) bezeichnet in diesem Schriftstuck ein DNA 
Molekul. eine DNA oder ein davon abgeleiteter KJon, welche enzymatisch aus einer Boten-RNA 
(mKNA) als Matrize 6 symhetisiert worden sind. Ein "DNA ^□51^^" ist ein DNA Molekul oder 
ein KJon eines solchen Molekuls, entweder doppel- oder einzelstrangig, welches Segmente em- 
halt, die in dieser Weise in der Natur nicht vorkommen. Ein nicht begrenzendes Beispiel ist eine 
cDNA oder eine DNA, welche keine Introns enthalt und direkt mit einer exogenen DNA-Sequenz 
verknuprt ist. 

3. Ein "Piasmid" oder generell ein M Vektor" ist ein DNA Konstrukt, welches genetische Informa- 
tion enthalt, die zur Replikation in einer Wirtszelie bendtigt wird. Solche Plasmide oder Vektoren 
enthaiten im allgemeinen die fur die Expression bestimmte Gensequenz und zusatzlich Sequenzen, 
welche die Expression fordern. unter Einschluss von Promotoren und Transkriptions- 
Initiationsstellen. Das Plasmid kann linear oder zirkular angeordnet sein. Im vorliegenden Schrift- 
stuck sind als Vektoren auch DNA-Konstrukte etngeschlossen. welche als "targeting vectors" 
bezeichnet werden. Diese werden zur gezieiten Geninaktivation oder zur Oberexpression eines 
Gens in vivo verwendet, 

4. NukJeinsauren sind miteinander "hybridisierbar", wenn mindestens ein Strang mit einem ande- 
ren unter bestimmten Bedingungen der Stringenz einen Doppelstrang bildet. Die Stringenz wird 
unter anderem bestimmt durch a) die Temperatur wahrend des Hybridisierungsexperimentes mit 
Oder ohne Waschschritt. b) die tonenstarke und Polaritat (zB Formamid) der Hybridisierungs- und 
Waschldsungen Die Hybridisierung erfolgt nur bei signifikanter Kompiementaritat der Basen; je 
nach Stringenz konnen allerdings Abweichungen von der Komplementaritat toleriert werden. Ty- 

6 Als Mairizc wird in diesem Schriftstuck cine RNA* odcr DNA-Sequctu bc/cichnei. welche fur sYnllieuschc Rc- 
aklioncn zur Hersictlung von DNA-Kopicn venvendet werden: der cntiltschc Ausdruck ist "template". 
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pischer*veise erfolgt eine Hybridisierung zweier Strange bei hoher Stringenz (zB. in wassriger 
Losung mit 0,1 x SSC bei 65 °C) nur, wcnn eine hohe Komplememaritat iiber die gesamte Lange 
vorliegt Mittlerc Stringenz (z.B. in wassriger Losung mit 0,5 x SSC bei 50 °C) und tiefer Strin- 
genz (zB. in wassriger Losung mit 1 x SSC bei 40 Q C) erfordert entsprechend ein geringeres 
5 Mass an Komplementaritat zwischen den hybridisierenden Strangen (Ix SSC entspricht einer Lo- 
sung von 0.15 M NaCl t 0.0 1 5 M Na Zitrat). 

5. Eine "isolierte" Nuldeinsaure oder ein "isoliertes" Polypeptid bezeichnet in diesem Schriftstiick 
15 eine Substanz der entsprechenden Stoffldasse, welche aus ihrer urspriinglichen Umgebung ent- 

fernt worden ist, beispielsweise ihrer natiirlichen Umgebung, sofern dieser StofFin der Natur vor- 
10 kammt. Die Isolierung bezeichnet einen Vorgang, bei welchem mindestens 50% der anderen 
Komponenten aus dem urspriinglichen Gemisch entfemt worden sind, vorzugsweise jedoch uber 
90%. 

6. AJs "Sonde" bezeichnet man eine Nukleinsaure. welche mit einem bestimmten Sequenzabschnitt 
des zu untersuchenden Gens hybridisiert. 

15 7. Eine "abgeleitete" Nukleinsaure bezeichnet eine Nukleinsauresequenz, welche einem bestimm- 
ten Abschnitt einer Sequenz entspricht. Dies sind Sequenzen, welche als homolog, ahnlich, kom- 
plementlr (d.h. "antisense") oder sequenz-konserviert oder flinktions-konserviert bezeichnet sind. 
Sequenz-konserviert sind solche Variamen, bei welchen ein oder mehrere Anderungen von Nu- 
30 kleotiden eines bestimmten Kodons keine Anderungen der Amino sauresequenz an dieser Stelle 

20 nach sich ziehen. Funktions-konservierte Varianten der 3GnT sind solche, bei welchen Mutatio- 
nen einzelner Aminosauren die Konformation und die Enzymaktivitat unter Einschluss der Sub- 
stratspezifitat nicht beeinflusst; diese Mutationen betrefTen unter anderen Austausche von Ami- 
35 nosauren mit ahnlichen physiko-chemischen Eigenschaften, wie den sauren, basischen oder hydro- 

phoben oder anderen. 

25 S. Ein "Donor- Sub strat" ist ein MolekuL welches von der Transferase erkannt wird und welches 
fur die Enzymkatalyse einen jV-Azetylgtukosamin-Rest beitragt. Fur die 3GnT ist das Donorsub- 
strat UDP-GlcNAc 7 . Ein "Akzeptorsubstrat" ist ein Molekiil, auf welches der GlcNAc-Rest durch 
die 3GnT iibertragen wird. Typischerweise wird dabei der GlcNAc-Rest in einer pi ^3 glykosidi- 
schen Bindung auf einen (3-anomerisch konfigurierten Galaktose-Rest iibertragen. Dieser Galakto- 
45 30 se-Rest ist beispielsweise Teil eines Af- oder O-gebundenen Glykans. ohne andere Moglichkeiten 

auszuschliessen. 



25 



40 



50 * UDP-GlcNAc sichi fur Urid i ndi pliosplio-.V-azci\ 1 1» I nkosain i n 
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9. Glykokonjugate sind Biomolekule, welche komplex verknupfte Glykane emhalten. Diese Stoffe 
umfassen Glykoproteine, Glykolipide und Proteoglykane {bzw. Glykosaminoglykane). 
Die vorliegende Erfindung bctrifft ein isoliertes DNA-Molekul unter Einschluss genomischer 
DNA und der cDNA, welche fur cine LDP-A^-A2etylgIukosaminyl:(31.4 Galaktosid: 01,3//- 
5 Azetylglukosatninyitransferase (Polylaktosaminyl Typ) kodiert. Die cDNA der 3GnT wurde so 
kJonien. dass die Sequertzahnlichkeiten einer Familie von (}l,3GaIaktosyltransferasen als Grund- 
lage zur Identifikation von runktions-undefinierten EST'-Sequenzen verwendet worden sind. Mil 
75 solchen Sequenzen wurde eine in unserem Labor entwickelte menschliche Genbank auf das Vor- 

liegen ahnlicher Sequenzen gepriift. Eine Sequenz, welche ein offenes Leseraster aufwies, wurde 
10 in einem Expressionsvektor zusammen mit einer spezifischen Bindungssequenz von 6 Histidi- 
nen'in Insekten-Zellen exprimien. Das exprimierte Produkt, welches den His-tag enthielt, wurde 
20 in eincm Enzymansatz, der als Donorsubstrate sowohl UDP-Galaktose als auch UDP-GlcNAc 

zusammen mit dem Akzeptorsubstrat LAcNAc 10 enthielt, auf seine Funktion gepriift. Es envies 
sich uberraschenderweise, dass die gemessene Aktivitat ausschliesslich auf die Zugabe des UDP- 
15 GlcNAc's zuruckzufuhren war. Dieser Befund, dass eine cDNA, welche mit einer Genfamilie der 
(SlJGalactosyltransferasen (Hennet T. et aL J. Biol. Chem. 1998, 273, 58-65) homolog ist, als 
Donorsubstrat nicht UDP-Galactose sondern UDP-W-Azetylglucosamin erkennt, aber mit den 
bekannten //-AzeiylglucosaminyUransferasen keine Homologie aurweist, ist neuartig. 

30 

20 Angaben zu den Reagenzien, DNA, Vektoren und Wirtszellen 

Bei der Erarbeitung vorliegender Erfindung wurden viele herkdmmiiche Techniken der Moleku- 

3 5 lar- und Zellbiologie verwendet. Diese Techniken entsprechen dem alleemeinen Wissenstand und 

werden unter anderem im folgenden Standardwerk im Detail beschrieben: Sambrook et al., 1989, 
Molecular Cloning: A laboratory Manual. 2. Auflage, Cold Spring Harbor Laboratory Press, Cold 
25 Spring Harbor. New York 

40 Die Erfindung umfasst alle NukJeinsaure Sequenzen entsprechend den erfindungsgemassen Se- 

quenzen dargestellt als Seq ID-Nr.la, bzw lb und davon abgeleitete Fragmente. Die Fragmente 
sind mindestens S Nukleotide lang, bevorzugt sind aber mindestens 1 2 Nukleotide und noch mehr 
bevorzugt 15 bis 20 Nukleotide Die Erfindung umfasst des weiteren alle Nukleinsaurederivate 

45 



25 



1 EST heisst "Expressed sequence lag" und bczciclmet undcfmicne DNA-Scqucruen welche aus der systemati- 

schen Erfassung von tncnschlichcn RiNA-Molckukn und ihrer revcrscn Trnnskripiion nbgcleiicl worden sind 

Diese EST Sequenzen sind in cincr bfTenliich zugangiichen Datcnbank abmfbar. 

* Diese aus 6 linear angcordnetcn Histidinc werden in diesem Schhftsiuck als His-tng bezeiclmet 

10 LacNAc sicht fur .V-nzctvilnkiosamm (GalaktoscU I=»4N-azctylgliikosamin) 
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cntsprechend den erfindungsgemassen Sequenzen, wclche unter den Stringerubedingungen von 1 
x SSC, 40 °C mil der Seq ID Nr. la bzw lb hybridisieren, bevorzugt sind Hybrid! sierungsbedin- 
gungen von 0,5 x SSC, 50 *C und noch mehr bevorzugt soiche von 0, 1 x SSC bei 65 °C. 
Die Nukleinsauren kdnnen unmittelbar aus Zellen isoliert werden Ais AJtemative kann auch die 
PCR Methode venvendet werden, um die erfindungsgemassen NukJeinsauren zu gewinnen, em- 
weder durch Gebrauch von isolierter RT nach reverser Transkription oder genomischer DNA als 
Matrize. Die fur die PCR notwendigen Primer konnen auf Grund der erfindungsgemassen Se- 
quenzen hergestelk und durch Einfuhrung von Sequenzen fur Restriknionsschnittstellen erganzt 
werden. 

Die erfindungsgemassen Sequenzen konnen am S\ bzw. 3* Ende naturliche oder heterologe flan- 
kierende Sequenzen mit oder ohne Expressions-regulierende Abschnitte wie Promotoren, Enhan- 
cers, Bindungsstellen, Polyadenylierungssequenzen, Imrone, 3'- oder 5' nicht kodierende Sequen- 
zen und ahnliches enthalten. Die Nukleinsauren konnen auch entsprechend dem allgemeinen Wis- 
sensstand modifiziert werden wie durch Methylierung, "Capping", Einruhren von Nukleinsaure- 
Analoga, Veranderungen der Phosphodiesterbrucken durch Einfuhren von ungeladenen Methyl- 
phosphonaten, Phosphotriestern, Phosphoroamidaten, Carbamate usw. und mit geladenen Brtik- 
ken (wie z.B. Phosphorothioate, Phosphorodithioate usw). Die Nukleinsauren konnen eine oder 
mehrere kovalente Substituenten besitzen, wie z. B. Proteine (wie NukJeasen, Toxine, AmikQrper, 
Signalpeptide, Polyl-L-Lysine), Interkalatoren (wie z.B. Akridin, Psoralen usw.), Chelatoren (wie 
Metallchelatoren, radioaktive Metalle, Eisen etc) und aikylierende Substanzen. Die erfindungsge- 
massen Nukleinsauren und ihre Derivate konnen writer als Methyl- oder Athyl-phosphotriester 
oder als Alkylphosphoramidate verandert werden. Ebenso konnen sie mit einem Marker wie ra- 
dioaktive Isotope, flu oreszier ende Stoffc. Biotin usw versehen werden. 

Brauchbare Sonden, welche auf Grund der erfindungsgemassen Nukleinsauren entwickelt werden, 
enthalten also mindestens 8 Nukleotide. welche in der Seq ID la bzw. lb oder Sequenzen- oder 
Funktions-konservierte Anaiogsequenzen oder Komplementarsequenz vorkommen und die mit 
einem oben erwahnten Marker versehen sind. 

Die Erfindung betriflft auch Nukleinsaure-Vektoren, welche die erfindungsgemassen Sequenzen 
oder Derivate und Fragmente davon enthalten. Eine breite Zahl von Vektoren, inklusive Plasmide 
und Viren sind fur die Replikation und/oder Expression in verschiedenen Wirtszellen beschrieben 
worden; diese konnen sowohl fur die Gentherapie als auch fur die Klonierung und fur die Protei* 
nexpression eingesetzt werden. 
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Rekombinante KJonierungsvektoren enthalien oft ein oder mehrere Repltkationssysteme fur die 
Klonierung oder die Expression, ein oder mehrere Selektionsmarker in der Wirtszelle wie bei- 
spielsweise fur die Amibioticareststenz, dazu eine oder mehrere Expressionskassetten. Die einge- 
fugten Sequenzen konnen nach Standartmethoden synthetisiert, aus naturlichen Quellen oder als 
5 Hybride isolien werden. Die Verknupfung der kodierenden Abschnitte der erfmdungsgemassen 
Nukleinsauren mit regulierenden Nukleinsaureelemenien oder mit anderen Protein-kodierenden 
Nukleinsauren kann mit bekannten Methoden erfolgen Geeignete Wirtszelien konnen mit irgend- 
15 einer geeigneten Methode transfektiert werden, wie z.B. durch Elektroporation, CaCk-verrnittelte 

DNA Aufnahme, Liposom-verpackte DNA, Lnfektion mit Pilzen, Mikroiniektion, virale Infektion 
10 usw. 

Geeignete Wirtszelien umfassen Bakterien, Archaebakterien, Piize, vor allem Hefen, Pflanzen und 
20 tierische Zellen. Besonders interessant sind Saccharomyces ceruvisiae, Saccharomyces pombe, 

Pichia pastoris, lnsekten-Zellen, Naurospora, CHO Zellen, COS Zellen, HeLa Zellen und im- 
mortalisierte myeloische und lymphoide ZelHinien Bevorzugte Replikationssysteme umfassen 
15 Ml 3, SV40, Baculovirus, Lambda, Retro-und Adenovirus. Eine grosse Zahl von Transkriptionsi- 
nitiations- und Terminationssequenzabschnitte sind bekannt und auch nachgewiesenermassen flir 
die Expression von heterologen Proteinen wirksam. Beispieie solcher Abschnitte, ihre Isolierung 
und Mutagenisierung sind im Fachbereich bekannt. Unter geeigneten Bedingungen konnen Wins- 
2Q zellen rekombinante 3GnT und Derivate davon exprimieren und deshalb als Quelle fur die Pro- 

20 duktion dieses Enzyms verwendet werden 

Mit Vorteil werdenDNA-Konstrukte, welchen ein Transkriptions-regulierendes Element zur 
3GnT kodierenden Sequenz beicefugt ist, verwendet. Dieser Promotor kann OperatorabscKnitte 
35 und/ode: ribosomale Bindungsstetlen enthalten Nicht erschopfend aufgezahlt fallen darunter 

bakterielle Promotoren, welche mit £ coli kompattbel sind wie [5-Laktamase (Penicillinase) Pro- 
25 motor, Laktose Promotor, Tryptophan Promotor, Arabinose BAD Operon Promotor, Lambda- 
abgeleiteter ?\ Promotor und N Gen Ribosomen Bindungsstelle; zudem der hybride tac Promotor 
aus den Sequenzen der Tryptophan und Lac UV5 Promotoren. Darunter fallen Hefepromotoren 
wie diejenigen flir die 3-PhosphogIyzeratkinase, die Glyceraldehyd-3-Phosphat-Dehydrogenase, 
die Galaktokinase (GAL1). dieGalaktoseepimerase, die saure Phosphatase (PH05) und Alkohol- 
30 dehydrogenase (ADH). Fur hohere eukaryontische Zellen fallen darunter die Promotoren flir den 
Simian Virus 40 (SV40), Rous Sarkoma Virus (RSV), Adenovirus (ADV). bovinem Papilloma 
Virus (3\?V) und CMV (Zytomegalievirus). Ebenfalls gehoren dazu die entsprechenden Termi- 
nator- und Poly-A kodierenden Sequenzen, sowie Enhancer- Sequenzen. welche die Expression 

50 
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erhohen konnen. Peptidsequenzen. welche die Sekretion der rekonbinanten 3GnT crletchtem wie 
Signalsequenzen, Praprosequenzen usw. sind eingeschlossen und allgemein bekannt. 
Die Erfmduna betrifft auch Nukleinsauren, welche fur die Wildtyp-Form oder eine abgeleitete 
Form der 3GnT kodieren, und welche in die Zellen transfektiert werden und mit der endogenen 
5 DNA der Zelle homolog oder nicht homolog rekombinieren 

Die Erfindung betrifft auch Nukleinsauren, welche als Sonden rur Entdeckung der 3GnT in ande- 
ren Spezies als den hier erwahnten und durch die Seq ID Nr la bzw lb spezifizienen murinen und 
15 hurnanen Formen, gebraucht werden. 



10 



10 Polypeptide und Antikorper 

20 Die Erfindung betrifft isolierte Peptide und Polypeptide, fur welche die erfindungsgemassen Nu- 

kleinsauresequenzen kodieren. Bevorzugt sind Peptide mit mindestens funf Aminosauren 
Nukleinsauren, welche for Proteine kodieren, konnen zur Expression rekombinanter Polypeptide 
in intakten Zellen oder in vitro Translationssystemen verwendet werden. Die zur Expression ver- 

25 15 wendeien Nukleinsauren konnen neben den herkommiichen molekularbiologischen Methoden 

auch chemisch synthetisiert werden. Die erfindungsgemassen Polypeptide mit den Seq-ID Nr. 2a 
bzw. 2b inklusive der Funktions-konservierten Varianten konnen aus naturlichen Organismen 
bzw Zellen oder aus Organismen bzw. Zellen, welche die rekombiname 3GnT heterolog expri- 

30 

mieren, isoliert werden. Die Organismen sind beispielsweise transgene Manse, welche das 3GnT 
20 Gen uberexprimieren oder Nutztiere, welche das 3GnT Transgen in der Milchdriise exprimieren. 
Die Zellen sind beispielsweise Bakterien, Pilze, Insekten, Pfianzen und tierische Zellen. Die he- 

35 teroiog exprimierten Polypeptide konnen auch als Fusionsproteine exprimiert werden. 

Die Methoden zur Isolierung von Polypeptiden sind allgemein bekannt. Nicht begrenzend aufge- 
zahh fallen darunter praparative Gel-Elektrophorese, praparative isoelektrische Fokussierung. 
25 HPLC, FPLC, Gel Filtration, Ionenaustauschchromatographie, Aussalzen und Affmitatschroma- 

40 tographie. Zur erleichterten Isolierung der rekombinanten 3GnT kann das Enzym mit einer Bin- 

dungsstelle gekoppelt werden, wie eine Polyhistidin-Sequerz von 4-8 Histidinresten (sog. "His- 
Tag", wobei die bevorzugte Variante 6 His-Reste enthait), oder Epitope fur die Bindung von 
monoklonalen AntikSrpern wie das FLAG-Epitop oder Myc-Epitop und andere. Bevorzugt ist 

45 

30 eine Immunatfmitatschromatographie mit Antikorpern gegen das rekombinante Enzym setber. 

Das Enzym kann als Hybridenzym exprimiert werden, wobei es direkt an ein anderes Enzym ge- 
koppelt wird zur Erleichterung der Katalyse. Bevorzugte Varianten sind mit einer 
SO p 1.4Galactosyltransferase gekoppelte 3GnT zur Herstellung des Keraian- und Polylac:osamingly- 
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cangerustes. Diese Hybridenzyme konnen entwcder als Fusionsproteine oder als getrennte Protei- 
ne mit odcr ohne "internal ribosomal entry sites" getrennte bicistronischen Vektoren exprimien 
vverden. Bevorzuete bicistronische Vektoren sind solche. bei denen die Reihenfolge der Expressi- 
on zu einer Angleichung der katalytischen Aktivitat der exprimienen Produkte fuhren. Solche 
Hybridenzyme konnen auch in multicistronischen Vektoren. welche noch fur andere Proteine wie 
Resistenzmarker und/oder andere Giykosyltransferasen kodieren, enthaiten sein. 
Die erfindungsgemassen Polypeptide konnen im Sinne posttranslatorischer Modifikationen veran- 
dert werden, wie durch Phosphorylierung, Sulfatierung. Acylierung und Glycosylierung. Auch 
kunstliche Veranderungen wie der Einbau radioaktiver Isotope beispielsweise durch metaboiische 
Markierung oder die Kopplung mit FluoreszenzfarbstofTen sind eingeschlossen Ebenso fallen 
darunter Fusionsproteine mit fluoreszierenden Proteinen wie dem "Green fluorescent protein". 
Die Erfindung betrifft Antikorper, welche immunogene Komponenten der 3GnT erkennen. Diese 
Antikorper kOnnen zur spezifischen Bindung des Enzyms mit oder ohne Neutralisation seiner Ak- 
tivitat eingesetzt werden. Unter den Antikorpern gegen die erfindungsgemassen Polypeptide fallen 
sowohl mono- wie polyklonale Antikorper. Solche Antikorper werden durch in vivo Immunisie- 
rung von Tieren wie Mause, Ratten, Kaninchen, Ziegen, Ese! und andere gewonnen oder durch in 
vitro Immunisierung von immunkompetenten Zellen. Die dazu verwendeten Antigene als Tetle der 
3GnT werden entweder aus naturlichen oder heterologen Quellen gewonnen. Die Antikorper sel- 
ber konnen auch rekombinant hergestellt oder biochemisch aus schweren und leichten Ketten ge- 
bildet werden. Die Antikorper betrefTen Hybridantikorper, bei welchen die Ketten mit zwei ver- 
schiedenen Spezifitaten gegen die 3GnT verbunden werden, univaiente Antikorper und FAB so- 
wie (FAB) 2 Fragments Die verschiedenen Antikorperformen sind in der Literatur beschrieben. 
Ihre Reinigung erfolgt bevorzugt uber Affmitatschromatographie; die erwahnten Methoden zur 
Polypeptidreinigung finden auch fur die Reinigung von spezifischen Antikorpern Anwendung. 
Die Antikorper konnen zur Quantifizierung der erfindungsgemassen Polypeptide angewendet 
werden: Die dazu verwendeten Methoden sind Enzyme-linked immunosorbent assays (ELISA) 
oder Radioimmunoassays (RJA) welche mit verschiedenen Enzymen/Substraten bzw. Isotopen 
durchgefuhrt werden. Diese Methoden sind in der Literatur beschrieben. 

Die Erfindung wird durch nachstehende Beispiele illustriert: 
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Beispiele: 

(Die Abbildungen befinden sich am Ende des Patentantrags) 
Beispiel 1: 

Ylmtmn o dtr iGnT. finer mil der B1 3GatT Genf amilie homoloaen cDNA 
Mit Hilfe des tblastx Algorithmic wurden EST-Sequenzen, welche mit denjenigen der Mause 
[Jl.SGalaktosyltransferase-Familie (Hennet T. et a!., J. Biol. Chem. 1998, 273, 58-65) Ahnlichkeit 
aufweisen, in der EST-Selction der GenBank identifiziert. Die menschliche und murine 3GnT 
cDNA wurde mit Hilfe eines 367 bp 11 Fragments, welches aus der EST Identifikations Nr 
AA150140 abgeleitet worden ist, aus einer menschlichen Fotalgehimbank (CLONTECH) bzw. 
) einer Gehirnbank neugeborener Mause (Stratagene) isolicrt. Die dazu benbtigte Sonde wurde mit 
Hilfe der PCR 12 aus 50 ng menschlicher T Zell cDNA als Matrize mit folgendem Primerpaar 5'- 
GC G ACT ACT AC CTGC C CT ACG-3 ' und TCCCTTCTCTGGCAAGCACT-3' mit 30 Zyklen bei 
95 °C fur 45 s, 58 °C fur 30 s und 72 X fur 45 s hergestellt. 



5 Beispiel 2 

. y.qiienzierung der 3GnT cDNA: Die humane und murine cDNA, welche wie im Beispiel 1 be- 
schrieben aus den entsprechenden Genbanken isoliert worden ist, wurde gemass der Dideoxy- 
Kettenterminationsmethode (Sanger F., Science 1981, 214,1205-1210) unter BenUtzung des En- 
zyms Sequenase 2.0 (USB) sequenziert. Die dazu benotigten Primer sind in der Tabelle 1 aufge- 
10 fuhn: 



" bp steht fur Basenpaare, kbp steht fur kilo-Basenpaar 
1 : PCR bezctchnei Polymerase Chain Reaction 
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Humane 3GnT 


Murine 3GnT 


10 


5'-CAGGAAACAGCTATGAC-3' (M13 rev) 


5-CAGGAAACAGCTATGAC-3' (M13 rev) 


S'-GTAATACGACTCACTATAGGGC-S 1 (T7) 


5'-GTAATACGACTCACTATAGGGC-3' (T7) 




5'-CAATGGGTTCAGTGACTTG-3' 


5'-AACCTCACGGCCAAGGTCCTG-3' 




S'-AGCGACCACAAGCGTGGCTG-T 


S'-GGATGCTTGGCCTGTGTCAG-S' 




5'-AGGTAGTAGTCGCAGAGTTG-3' 


5'-CAAGCATCCTGAACAATCTG-3' 


15 


5'-GTG AG GTTTTCGTAGG CGTC-3* 


5'*CATCCAGCCAGGTCAGCATG-3" 



Die Sequenz der hurnanen 3GnT ist als Seq-ID Nr. la, dieienige der murinen als Seq-ID Nr. lb 
5 voll standi g beschrieben. 

20 



Beispiel 3 

Proteinsequenzvergleich : Schema 4 vergleicht die Protein Sequenzen der Maus 3GnT mit den 
25 bekannten Maus p3Gal-Ts, als sog. "ClustalW alignment. Konservierte Aminosaure werden mit 

10 schwarzem Hintergrund dargestellt. Die weisse Pfeile zeigen die Cysteine, welche unter den 
p3Gal-Ts konserviert sind und der schwarzer Pfeil zeigt die einzige Cystein-Stelle, die in den funf 
Proteinen konserviert ist. 

30 
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Schema 4: Sequenzvergleiche der vier murincn homologen pl f 3GaIactosyltransferasen mit 
der erfindungsgemasscn murincn 3GnT (entsprechend Scq-ID Nr. 2b) 



p3GsiM 

p3Gi.T-ltt 
(BGiTT-W 



P3GiiT4l 
£3Gr.T 



-MXVFRR- awrhrvalglggupcct--ulyurcasegetpsasgwrSra)<; 



(J3GaJT-J : QSTTHKEFC- 
JiSGuT-il : HAAEPGQI 

: flrsRPSDVi 

p3Gart-lV : jCTAPEHUi 
p3GrJ : QASAPRAVEJ 




[J3GafT-l 

p3GjTT.ll 

fttGaTNH 

|J3G«rT-TV 

p3GfiT 



p3GafT-E 

(J3GHT-1I 

(BGaTMII 

33GaiT4V 

33GftT 



p3Ga(T-J 

(BGaTMl 

jBGilT-lll 

|13GarNV 

P3GnT 



ft 

jATFCSKAl 
jATYCPHTI 
AFRjjjMEFCPI 

ginEnkycpi 
mltHderv- 



feVRSKWYMPRDLj 
MOSKWYVPPOU 
KFFHKNHISYQEj 
JTPESRHHVSEELj 
JvKPG-GR'tsRE 

kmayslSryrrJ 
rvsyssskys^ 

pldr-cSygxr 

; YKSR-g5n*iQY( 



180 200 220 
JGD EN NFICS- I KI AT lSiKcNAD P — VtNQMjjEQjjSQI 
kNETUPg-IQIIRV jL WI5IKLNG- YIQHA 1QE jSRQ\ . 
^EKKSW^-YEVLTfCl GqQAEREDKTIALS JED JHVIYI 
F GAIREARS-FRVQTL jt. BkPRRQ QUO JSS J5AAHI 

^laperrgSpeovvwriJaEtgclgs-- eerraJelSqaqi 

300 




280 

flLKPSTKPRRR 

Ikpdipprhn 

jlMNHSEK • 

QRGGP5EQWQKGHEAQEETTAI HEEHRGQAVPLLj 

Irareparrrr ' 



320 

ing-gpi 

JWGYAPN 

Sypupnysy 



iN--5PP(jCS27^f^VAELnYnSLKTRLLHLg 
:R- -yPMKsJffljFgGDLAEK FKVSIGIRRLHLPJ 
B "^ c ?lfflMKOLVPRJYEHHSKVKPIICFS 
5t5SlSiSAVQLI LKVASRAPP tPLSfe 
S^wSAOLVHYflRLSREYLRAWHsjalJ^ 



460 



420 440 ft 

ffQI S PEEShRIWND&SS KX H — LRC 

JqFQPSeJiKYWNhJqQNK H—NACANAAKEKAGRYRHRICLH 

KG FS SK EylT FWQvJ. RN TTCHY— - 

jKVDPwSQEAWXL5sGMNGERTA"-PFGWLQG-aGTLRCRFIAWF55- 
jKQSPE^EK^HjLHEGRLCKHEVQLRLSYVYiyrfSAPPSQCCQRKEGVP- 



23 



20 40 60 80 

MASKVSClWLSWOfASALWYL 

KLQWRRJWCCFAIO^PKRSLLRTPLTCWIS^ : 60 

MAPAVLT ALPNRMS LRSLICWSLLLISLLSpL : 31 

MPlSlFRRVlLAVLtlVIIYiTlFG : 24 



LOO 120 140 ft 

SITRFTS SYTGSKP-—FSHLTVARXNFTFGNIR-TRPINPHSFEFLINEPNICCEKNI 

TIWCEVAPQURPHlASNSSSTELSPO^aQNUSA^ 

VIWYLSLP HY WIERVtWHYFYEY- - EPIYRQOFRFTLREHSNCSHQI 

PSGIG — EELLSLSLASLLPAPASPGPPULPRLLISNSH-ACGGSi 




213 
289 
215 



fcVHWRVRPT : 230 
SffSGR—G : 186 



380 400 

JtaRXLGjjHPFQNSG— FNHW : 288 

ffiiaAXLRjoPVPPPNEFVFNHW : 367 

[ICinllkJoihipedtklffly : 293 

arrggJapthcvkl^gathy : 310 

IAPVdJqREHDPR— FDTE : 261 



480 



326 
422 
: 331 
371 
325 



45 



10 



Beispief 4 

Die Expression der 3GnT im Oruanismus : Die exprimienen mRNAs wurden mit Hilfe der Nort- 
hern blot Analyse unter Anwendung kommerziell erhahlicher Analysefilter (englisch "blot"), auf 
welchen die elektrophoretisch aufgetrennten mRNA's verschiedener Organe immobilisiert sind 
(CLONTECH), durchuefuhn Um DNA-Sonden nut erhohtem GC-Gehalt zu vermeiden, wurden 
j'-Fragmente der murinen und humanen 3GnT prapariert. Ein Sacl-P.stl 668 bp-Fragment der 
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murinen P3GnT cDNA und ein 367 bp Fragment der Region der humanen p3GnT cDNA zwi- 
schen NukJeotid 616 and 977 vvurden mit [a- 32 P]-CTP phosphoryliert (Hartmann Analytics, 
Braunschweig, Germany) mit "random priming" (Sambrook et al., 1989, Molecular Clonins: A 
laboratory Manual, 2. Auflage, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New 
York) und mit den Poly(A)" RKA Filter (blots) hybridisiert. Die Filter (blots) wurden in 0.1 x 
SSC, 0.1% SDS biszu 55 °C gewaschen and fur vier Tage in Verstarkerkassetten bei -70 °C. ex- 
poniert. 



Abb. 1: Expression der erfindungsgemassen 3GnT in verschiedenen Geweben der Maus 
und des Menschen (Northern Blot Analyse) 

Die Abb. 1 zeigt das Resultat: Jede Spur zeigt ca 2 ug Poly(A)~ RNA. Links sind die RNA Gro- 
ssenmarker in kb angegeben. In alien umersuchten menschiichen Organen wurden drei Tran- 
skripte (1,6; 2,4, und 3,3 kb als starkstes Signal) gefunden. Bei der Maus wurde ein 2,2 kb Tran- 
skript in den meisten Geweben gefunden, dazu eine schwacher exprimierte Form von 3,7 kb in der 
Lunge und Niere. Schwache Signale fand man in der Leber und im Skelettmuskel. 



Beispiel 5 

Expression der 3GnT: Ein EcoRJ-XhoI 1,9 kbp Fragment wurde aus einer menschiichen 3GnT 
cDNA, welche fur ein Protein entsprechend der Seq ID Nr 3 kodiert, abgeleitet und im FastBac- 
HTc Vektor (Life Technologies), welcher mit EcoRI-XhoI vorher linearisiert worden ist, subkio- 
niert. Das Maus EcoRI-XhoI Gen wurde als StuI-StuI 1 kbpFragment, welches der kodierenden 
Region ohne cytoplasmatische und Transmembrandomane entspricht, im FastBac-HTc Vektor 
subkjoniert. Rekombinante Baculoviren wurden mit der Transposon-vermittelten Rekombination 
entsprechend des vom Hersteller empfohlenen Protokolls hergestellt. 

Die Insekten-Zellen wurden mit einer MOI 13 von 10 infiziert und bei 27 °C wachsen gelassen bis 
zur Messung der 3GnT Aktivitat. 



u MOI bczetclinet "muliiplicit>' of infection" 
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1 7 

Beispiei 6 

Messung der Aktivitat der rekombinanten 3GnT- 

5 x 10 6 Insekten-Zellen, wclchc mil dem Wildiyp oder mit dem rekombinanten Baculovirus infi- 
ziert warden waren, wurden 72 h nach Infektion mit 2% Triton X- 100 in I ml Phosp hat- Puffer 
wahrcnd 15 min auf Eis lysiert. Das Lysat wurde in Gegenwarx von UDP- 14 C-GlcNAc als Donor- 
und LacNAc-pNP 14 (Toronto Research) als Akzeptorsubstrat wahrend 60 min bei 37 °C unter 
Zugabe folgender Ingredienzien inkubiert: 10 uJ des Zell-Lysates in 50 eines 50 mM Kakodylat 
Puffers, pH 7,0, 20 mM MnClj. 5% Me^SO, 0.75 mM ATP, 0.5 mM UDP-GlcNAc mit Zugabe 
von 5x10* cpm von UDP-[ I4 C]GlcNAc (Amersham) und verschiedenen Akzeptorsubstraten. Die 
Reaktion wurde gestoppt durch Verdunnung mit 0,4 ml eiskaltem H 2 0. Das Enzymgemisch wur- 
de auf eine SeP-Pak Saule gegeben, gewaschen und das haftende Produkt mit Methanol eluiert 
und mit Flussigscintillationsxihlung gemessen. Folgende Resultate wurden erhoben (siehe Tabelle 
2): 

Tabelle 2: Substratspezifitiit der erfindungsgemassen 3GnT 

Akzeptoren Sf9° Wildtyp 3GnT* 



pmob'min nig prot 



Gaipi-4GlcNAc-pNP f 
Gaipi-4Glc-bzl rf 


5 mM 


6 


1,478 


5 mM 


4 


1,034 


Galp 1 -4GlcN Ac-octyl' 


2mM 


5 


284 


Gaipi-3GlcNAc-octyi 


2mM 


5 


8 


Gaipi-3GaINAc-octyI 


2mM 


5 


4 


Gala-pNP 


5 mM 


4 


89 


GaiP-pNP 


5mM 


4 


26 


GalNAca-bzl 


5 mM 


4 


5 


GalNAcp-bzI 


5 mM 


5 


6 


GlcNAca-bzl 


5 mM 


4 


4 


GlcNAc3-bzI 


5 mM 


11 


7 


GlcNAc31-3GalNAcbzI 


5 mM 


8 


5 



a : Sf9 steht fur Spodoptera frugiperda 9-Zell-Lysat mit Wildtyp Baculovirus infiziert, ais 
neg, Kontrolle 

* : Sf9 Zell-Lysat (mit 3GnT-rekombinantem Baculovirus infiziert) 

c : pNP ist para-nitrophenyl 

d : bzl ist benzyl 

*: octyl, 0-(CH 2 ) 8 -C0 2 Me 



u LacNAc-pNP bezcichnet X-azctvUakiosamiii-p-niirophenyl 
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Beispiel 7 

PoMactosamin synthase- Aktivitat der 3GnT 

Das Enxym wurde im FastBac-HTc vector (Life Technologies) subkioniert, in 5 x 10 6 Sf9 Zellen 
10 transfektien und 72 h nach Infektion in 1 ml ernes 2% Triton X-lGO-hakigen PhosphatpufTers (pH 

5 7,4). auf Eis wahrend 15 min lysiert. Die zytoplasmatische und solubilisierte Membranfraktion 
wurde mil Zentrifugation bei 300 xg wahrend 5 min gewonnen. Die 03GnT Aktivitat wurde mit 
10 ul des Zelllysates in 50 uJ eines 50 mM Kakodylat Puffers, pH 7,0, 20 mM MnCK, 5% 
MfrjSO, 0.75 mM ATP, 0.5 mM UDP-GlcNAc mit Zugabe von 5 x 10 4 cpm von UDP- 
[ lJ C]GIcNAc (Amersham) und verschiedenen Akzeptorsubstraten gemessen. Die Reaktion wurde 
10 gestoppt durch Zugabe von 0.5 ml eiskalten Wassers. Die Reaktionsprodukte wurden von den 
Edukten durch hydrophobe Chromatographic an Sep-Pak ds Saulen (Waters) getrennt im Falle 
des Gebrauch von Akzeptoren mit hydrophobem Aglycon (Hennet T. et al, J. Biol. Chem. 1998, 
273, 5S-65). Im Falle der Anwendung von Laktose, W-Azetyllaktosamin, Gal-01,3-GlcNAc-//- 
Azetyllaktosamin (lac-A-tetraose) und Ga]-pl,4-GlcNAc-//-Azetyllaktosamin (lac-jV-neo- 
25 ]5 tetraose), wurden die Reaktionsprodukte an AGl-XS Saulen (Bio-Rad) gereinigt, indem 2 ausge- 

schlossene Volumina gesammelt wurden (2 ml) (Malissard, M. f et al., Eur. J. Biochem. 1996, 
239, 340-348). Die Hydrolyse von UDP-GlcNAc in Zell-Lysaten wurde in Enzymansatzen ohne 
Akzeptorsubstrate gemessen. Die [ I4 C]-markierten Produkte wurden mit Flussigszintillationszah- 
lung gemessen(Rackbeta, Pharmacia). Die Resultate sind auf Abb. 6 aufgefuhrt. 
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Abb. 2: Polvlactosaminsynthase-Aktivitat der erfindungsgemassen 3GnT 



50 



Die Abb 2 zeigt die Eigenschaft der erfindungsgemassen 3GnT, den Tetrasaccharid- Akzeptor 
lac-A'-neo-tetraose effektiv umzusetzen. Dieser Befund beweist, dass das 3GnT Enzym Polylakto- 
25 saminketten sowohl initieren wie auch verlangern kann. 

Beispief 8 

Identiflkation des erfindungsgemassen 3GnT-Produktes mit Massenspektrometrie und Methvlie- 
rungsanalvse 

30 Um den Bindungstyp der von der erfindungsgemassen 3GnT katalysierten elykosidischen Bindung 
zu bestimmen, wurde eine Inkubation mit GaI(pl-4)Glc(pl-OBzl) al Akzeptor im grossen Mass- 
stab durchgefiihrt. Die Inkubationsbedingungen entsprachen denjenigen unter Beispiel 6. Das Tri- 
saccharidprodukt wurde mit HPLC isoliert und mit verschiedenen Methoden analysien. Seine 
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molekutare Masse wurde nach Permethylienmg mit dem positiv-Ionen Modus MALDI TOF Mas- 
sen Spektromeme bestimmt: Die erhobene Bnjttoforme! war HexNAcHexzBn {m z 798, 
([M-Na]"). Die Methylierungsanalyse zeigte die Gegenwart von 4'-substituierten Glc, 3'- 
substituienen Gal und terminates GlcNAc: damn konnte die (l-3)-Bindung zwischen GlcNAc 
und Gal bewiesen werden. 



Bei spiel 9 is 
THpntlfiV.tinn ries erfmdun^ftmassen 3G n T-Produktes mit Magnetrespnanzspektrometrie 

Urn die Richtigkeit der unter Beispiel 7 beschriebenen Analyse zu bestatigen und urn die anomere 

0 Konfiguration des von der erfindungsgemassen 3GnT ubertragenen Zuckers zu bestimmen, wur- 

den ID und 2D ! H NMR Experimente durchgefuhrt. Die am meisten distal verlagerten Signale im 

ID l H NMR Spekirum (Fig. 3a) des Trisaccharids gehcirten zur Benzyl Gruppe (5 7 431. 4.930 

(J tm 11.6 Hz), 4.755 (J itm 11.6 Hz). Mit Hilfe von 2D TOCSY (20 und 100 ms) und ROESY 

Experimental konnten die drei anomeren Doppelsignale bei 5 4.673 (V u 8.6 Hz), 4.546 ( 3 J K: 8 0 

15 Hz), und 4 423 (Vu 8.0 Hz) den Strukturen P-GlcNAc, 0-Glc, bzw 0-Gal, zugeordnet werden. 

Das ROESY Spekirum (200 ms, Fig. 3b) eriaubte die Bestimmung der zwei glykosidischen Bin- 

dungen. Die anomere Spur des Gal Restes zeigte neben zwei innermolekularen "Crosspeaks" (Gal 

H-l,H-3,5 3.7U Gal H-l.H-2 (TOCSY Transfer), 5 3.573), einen ir.termolekularen crosspeak 

zwischen Gal H-l und Glc H-4 (5 3.639). Die anomere Spur des Glc Restes zeigte drei intramo- 

20 lekulare crosspeaks bei 5 3,604 (Glc H-l.H-3). 3.573 (Glc H-l.H-5), und 3.338 (Glc H-l,H-2 

(TOCSY Transfer)). Schliesslich zeigte die anomere Spur des GlcNAc Restes neben drei intra- 

molekularen crosspeaks (GlcNAc H- 1, H-3. 5 3.557, GlcNAc H-l.H-5, 5 3.446; GlcNAc H-l.H-2 

(TOCSY Transfer), 6 3.74), einen intermolekularen crosspeak zwischen GlcNAc H-l und Gal H- 

3 (5 3.71). Zusammenfassend ergeben die Resultate den Nachweis des Produktes GlcNAcflil- 

25 3)Gal(pl-4)Glc(pl-OBn). 

Abb. 3: 600-MHz ID (a) und 2D ROESY (200ms) (b) l R NMR Spektrum des isolierten 
Trisaccharids GlcNAc(pl-3)Gal(Pl-4)Glc{|31-OBn) (C-B-A). 



" Die Magneuesorwnzspektromeirie wrd in diesem Schnftstflck als NMR (Nuclear magnetic resonance) beze.ch- 
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Patentanspruche 

1. Eine isolierte Nukteinsaure, welche far die UDP-//-Azetylglukosarninyl:pi,4 Galaktosid: 
pi,3Y-Azetylgiukosaminyltransferase (Polylaktosaminyl Typ) kodiert, gemass Seq-ID Nr. la bzw 

5 lb. 

2. Eine von der N'ukleinsaure nach Anspruch I abgeicitcte NukJcinsaure. 

3. Ein DNA-Konstrukt, das eine DNA-Sequenz gemass Anspruch 1 enthalt. 

4. Ein DNA-Konstrukt, das eine DNA-Sequenz gemass Anspruch 2 enthalt. 

5. Eine Zelle, welche ein DNA-Konstrukt nach Anspruch 3 enthalt. 
10 6. Eine Zelle, welche ein DNA-Konstrukt nach Anspruch 4 enthalt. 

7. Ein Verfahren zur Herstellung von 3GnT-Polypeptiden dadurch gekennzeichnet, dass 

a) ein isoliertes DNA-Molekul. welches fur die 3GnT kodiert oder ein davon abgeleitetes Kon- 
strukt in eine Wirtszelle eingefuhrt wird, 

b) die Wirtszelle unter die fur die Expression von 3GnT giinstigen Bedingungen kultiviert wird 
15 c) die 3GnT, welche von den Wirtszellen produ2iert wird, isoliert wird. 

8. Ein Verfahren fur die Herstellung von Dt-oder Oligosacchariden dadurch gekennzeichnet, a) 
dass die genannten Di-oder Oligosaccharide die Struktur GlcNAcpl=>3Gal enthalt en 

b) dass enzymatisch aktive, nach Anspruch 7 hergesteltte 3GnT UDP-GlcNAc als Donorsubstrat 
und pGal-teirninierte Akzeptorsubstrate erkennt und den GlcNAc-Rest ubertragt. 
20 9. Ein Verfahren nach Anspruch 8 dadurch gekennzeichnet, dass Glykanketten beliebiger Lange, 
welche das Disaccharid GlcNAcpi=>3Gal als repetitives Element enthalten, in vitro hergestellt 
werden, indem dem Reaktionsansatz zusatzlich eine pl,4Galaktosyltransferase mit UDP- 
Galaktose als Donorsubstrat zugegeben wird. 

10. Ein Verfahren nach Anspruch 9 t dadurch gekennzeichnet, dass Glykanketten beliebiger Lange, 
25 welche das Disaccharid GlcNAcpi^3Gal als repetitives Element enthalten, in vivo hergestellt 
werden, indem die Zelle zusatzlich mit einer pl,4Galaktosyltransferase transfektiert wird. 
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Abb. 1 



mouse tissues human tissues 
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Abb. 2 
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No acceptor Lactose LacNAc Lac-N- Lac-N-neo- 

totraose tetraose 

Acceptor Substrates 
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Abb. 3 
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Die tblgenden Schemata, und detaillierten Ausffihrungen erginzen die Beschreibung der Erfin- 
dun; 

Schema la: Verbindung milder Sequeiuidentifikationsnumnier la 

5 Dieses Schema zeigt die Nukleinsauresequenz der cDNA, welche fur die humane UDP.V- 
Azetylsluko«minyl:pi.4 Galaktosid: pi.J^Azetylglukosaminyltransferase (Polylakiosaminyl 

Typ) kodiert 
(1) Seq-IDNr la. 
(i) Sequenzkennzeichen: 
10 (A) LANGE. 990 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: EINZELSTRANG 

(D) TOPOLOGIE: linear 

1 5 (ii) ART DES MOLEKULS: cDNA zu mRNA 

(iii) URSPRUNGLICHE HERKUNFT: 
(A) ORGANISMUS: Homo sapiens 
(D) ENTWICKLUNGSSTADRJM: Fotalstadium 
20 (F) GEWEBETYP: Gehirn 

(vii) UNMITTELB ARE HERKUNFT: 

(A) BIBLIOTHEK: X-Phagen Genbank aus fotalem menschiichen Gehirn (CLONTECH, Palo 
25 -Alto, CA, USA) 

(B) KLONE: GT99 
(ix) MERKMAL 

30 

(A) NAME/SCHLUSSEL: Sequenzabschnitt codierend fur cytoplasmaiische Domane 

(B) LAGE; 1-33 
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(A) NAME/SCHLUSSEL; Sequenzabschnitt codierend fur Transmembran-Domane 

(B) LAGE: 34-90 



(Lx) NERKMAL 



(A) NAME/SCHLUSSEL; Sequenzabschnitt codierend fur Stamm und Katalytische Domane 

(B) LAGE: 91-990 



(ix) MERKMAL 



(A) NAME/SCHLUSSEL; Sequenzabschmtt codierend fur das Gesamtprotein 

(B) LAGE; 1-990 



1 ATGAATCTGC TGCGGCGGGC GTGGCG3CGG CGGGCGGCGC TAGGCCTGGG CACGCTGGCG 
TACTTAGACG ACGCCGCCCG CACCGCCGCC GCCCGCCGCG ATCCGGACCC GTGCGACCGC 

61 CTGTGCGGGG CGGCGCTGCT CTACCT GGCG CGCTGCGCGG CCGAGCCCGG GGACCCCAGG 
GACACGCCCC GCCGCGACGA GATGGACCGC GCGACGCGCC GGCTCGGGCC CCTGGGGTCC 

121 GCGATGTCGG GCCGCAGCCC GCCTCCCCCC GCGCCCGCGC GCGCCGCCGC CTTCCTGGCA 
CGCTACAGCC CGGCG7CGGG CGGAGGGGGG CGCGGGCGCG CGCGGCGGCG GAAGGACCGT 

121 gtgctgg7g3 ccagcgcgcc ccgcgccgcc gagcgccgca gcgtgatccg cagcacg7gg 
cacgaccacc gg7cgcgcgg ggcgcggcgg ctcgcggcgt cgcactaggc gtcgtgcacc 

cttgcgcggc gcggggcccc gggcgacgtg tgggcgcgct ttgccgtggg cacggccggc 
gaacgcgcc3 cgccccgggg cccgctgcac acccgcgcga aacggcaccc gtgccggccg 

301 c7gggcgccg aggagcggcg cgccctggag cgggagcagg cgcggcacgg ggacctgctg 
gacccgcggc tcctcgccgc gcgggacctc gccctcgtcc gcgccgtgcc cctggacgac 

3 51 ctgctgcccg cgctgcgcga cgcctacgaa aacctcacgg ccaaggtgct ggccatgctg 

gacgacgggc gcgacgcgct gcggatgctt ttggagtgcc ggttccacga ccggtacgac 

4 21 GCCTGGCTGG ACGAGCACGT GGCCTTCGAG TTCGTGCTCA AGGCGGACGA CGACTCCTTC 

CGGACCGACC TGCTCGTGCA CCGGAAGCTC AAGCACGAGT TCCGCCTGCT GC7GAGGAAG 

4 31 GCGCGGCTGG ACGCGCTGCT GGCCGAGCTG CGCGCCCGCG AGCCCGCGCG CCGCCGCCGC 
CGCGCCGACC TGCGCGACGA CCGGCTCGAC GCGCGGGCGC TCGGGCGCGC GGCGGCGGCG 

5U CTCTACTGGG GCTTCTTCTC GGGCCGCGGC CGAGTCAAGC CGGGGGGGCG CTGGCGCGAG 
GAGATGACCC CGAAGAAGAG CCCGGCGCCG GCTCAGTTCG GCCCCCCCGC GACCGCGCTC 

£01 GCCGCCTGGC AACTC7GCGA CTACTACCTG CCCTACGCGC TGGGCGGCGG CTACGTGCTC 
CGGCGGACCG TTGAGACGCT GATGATGGAC GGGATGCGCG ACCCGCCGCC GATGCAC3AG 

col TCGGCCGACC TGGTGCACTA CCTGCGCCTC AGCCGCGACT ACCTGCGCGC CTGGCACAGC 
AGCCGGCTGG ACCACGTGAT GGACGCGGAG TCGGCGCTGA TGGACGCGCG GACCGTOTCG 
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121 GAGGAZGTGT CTC7GGGCGC CTGGCT3GCG CCGGTGGACG TCCAGCGGGA GCACGACCCG 
ctcctgcaca gagacccgcg gaccgaccgc ggccacctgc AGGTCGCCCT CGTGCTGGGC 

781 CGCTTCGACA CCGAATACCG GTCCCGCGGC TGCAGCAACC AGTACCTGGT GACGCACAAG 
5 * GCGAAGCTGT GGCTTATGGC CAGGGCGCCG ACGTCGTTGG TCATGGACCA CTGCGTGTTC 

8 41 cagag:ctgg AGGACATGC7 GGAGAAGCAC gcgacgctgg CGCGCGAGGG CCGCCTGTGC 

GTCTC 33ACC TCCTGTACGA CCTCTTCGTG CGCTGCGACC GCGCGCTCCC GGCGGACACG 

10 501 aagcg:gagg 7GCAGCTGCG CCTGTCCTAC GTGTACGACT GGTCCGCGCC GCCCTCGCAG 
TTCGC3CTCC ACGTCGACGC GGACAGGATG CACATGCTGA CCAGGCGCGG CGGGAGCGTC 

9 61 TGCTGICAGA GAAGGGAGGG catcccctga 

ACGACG3TCT CTTCCCTCCC G7AGGGGAC7 



Schema lb: Yerbindung mit der Sequenzidentifikntionsnummcr lb 

Dieses Schema zeigt die Nukleinsauresequenz der cDNA, welche fur die murine UDP-A^- 
Azetylglukosaminyl:pl,4 Galaktosid: pi,3A^-Azetylgtukosaminyltransferase (Polylaktosaminyl 
20 Typ) kodiert 

(l)Seq-EDNr. lb. 

(i) Sequenzkennzeichen: 

(A) LANGE: 978 Basenpaare 

(B) ART: Nukleinsaure 

25 (C) STRANGFORM: EINZELSTRANG 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: cDNA zu mRNA 

30 (iii) URSPRCNGLICHE HERKUNFT: 
(A) ORGANI SMUS: Mus musculus 
(D) ENTW1CKLUNGS STADIUM: Fotalstadium 
(?) GEWEBETYP: Gehirn 

35 (Mi) UNMITTELB ARE HERKUNFT: 

(A) BEBLIOTHEK: >.-Phagen Genbank aus fctalem murinen Gehirn (Stratagene: La JoIIa, CA, 
USA) 

40 (B) KLONE. Bezeichnung wahlen 



ERSATZBLATT (REGEL 26) 



WO 00/11190 



4 



PCT/CH99/00365 



(ix) MERKMAL 



(A) NAME/SCHLUSSEL Sequenzabschnitt codierend fur cytoplasmatische Domane 

(B) LAGE: 1-33 



(ix) MERKMAL 



(A) NAME/SCHLUSSEL: Sequenzabschnitt codierend fur Transmembran-Domane 

(B) LAGE: 34-90 



(ix) MERKMAL 



(A) NAME/SCHLUSSEL: Sequenzabschnitt codierend fur Stamm und Katalytische Domane 

(B) LAGE: 91-978 



(ix) MERKMAL 



(A) NAME/SCHLUSSEL: Sequenzabschnitt codierend fur das gesamte Protein 

(B) LAGE: 1-978 



1 ATGA.-.GGTAT TCCGGCGCGC TTGGCGGCAC CGGGTGGCGC 7GGGCCTAGG CGGCCTGGCG 
TACTTCCATA AGGCCGCGCG AACCGCCGTG GCCCACCGCG ACCCGGATCC GCCGGACCGC 

51 TTCTGCGGCA CCACTCTGTT GTACCTGGCG CGCTGCGCTT CCGAGGGCGA GACGCCCTCC 
AAGACGCCG7 GGTGAGACAA CATGGACCGC GCGACGCGAA GGCTCCCGCT CTGCGGGAGG 

121 GCTTCCGGAG CCGCTCGGCC CCGCGCTAAG GCCTTCCTGG CGGTGCTGGT GGCCAGTGCG 
cgaa:-gcctc GGCGAGCCGG GGCGCGATTC CGGAAGGACC GCCACGACCA ccggtcacgc 

131 ccccgcgcgg tcgagcgccg caccgcagtg cgcagcacgt ggctggcacc ggagaggcgt 
ggggcgcgcc agctcgcggc gtggcgtcac gcgtcgtgca ccgaccgtgg cctctccgca 

241 ggcggacccg aggacgtgtg ggcgcgcttc gccgtgggca ctggcggctt aggctcggag 
ccgcc7gggc tcctgcacac ccgcgcgaag cggcacccgt gaccgccgaa tccgagcctc 

301 gagcc-gcgcg ctcttgagct cgagcaggcg cagcacgggg acctgctgct gctgcccgcc 
ctcgccgcgc gagaactcga gctcgtccgc gtcgtgcccc tggacgacga cgacgggcgg 

351 CTGCGCGACG CCTACGAGAA CCTCACGGCC AAGGTCCTGG CCATGCTGAC CTGGCTGGAT 
GACGCGCTGC GGATGCTCTT GGAGTGCCGG TTCCAGGACC GGTACGACTG GACCGACCTA 

421 GAGCGCGTGG ACTTCGAGTT CGTGCTCAAG GCGGACGACG ACTCCTTTGC GCGCCTGGAC 
CTCGCGCACC TGAAGCTCAA GCACGAGTTC CGCCTGCTGC TGAGGAAACG CGCGGACCTG 
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GCTA7CC7GG 7GGACCTACG CGCACGGGAG CCCGCACGCC GCCGGCGCCT CTACTGGGGC 
cSScC ACC7GGATGC GCGTGCCCTC GGGCG7GCGG CGGCCGCGGA GATGACCCCG 

_- TCCG ggcGCGGGCG CGTCAAGCCG GGAGGTCGCT GGCGAGAAGC AGCCTGGCAA 
SSSSSSC CCGCGCCCGC GCAGTTCGGC CCTCCAGCGA CCGCTCTTCG TCGGACCGTT 

*m CTCTG-GACT ACTACCTGCC CTACGCGTTG GGCGGTGGCT ATGTCCTTTC TGCGGACC7G 
gXgIcG^GA TGATGGACGG GATGCGCAAC CCGCCACCGA TACAGGAAAG ACGCCTGGAC 

rTrr t— arc TGCGCC7CAG CCGCGAGTAC CTGCGCGCGT GGCACAGTGA AGACGTATCG 
CACGT.^TGG ACGCGGAGTC GGCGCTCA7G GACGCGCGCA CCG7GTCAC7 TCTGCATAGC 

7 21 C7GGGCACC7 GGCTGGCACC AGTGGATGTG CAACGGGAGC ACGACCCACG CTTCGACACG 
GACCCGTGGA CCGACCGTGG TCACCTACAC GTTGCCCTCG TGCTGGGTGC GAAGCTGTGC 

GAGTACAAAT CTCGAGGCTG CAACAATCAG TATCTGGTGA CACACAAGCA AAGCCCAGAG 
c^Stgt^a GAGCTCCGAC GTTGTTAGTC ATAGACCACT GTGTGTTCGT TTCGGGTCTC 

841 GACATGTTGG AGAAGCAACA GATGTTGCTG CATGAGGGCC GGTTGTGCAA GCATGAGGTG 
ctgtaSacc TCTTCGTTGT CTACAACGAC GTACTCCCGG CCAACACGTT CG7ACTCCAC 

901 CAGTTGCGCC TTTCCTATG7 C7A7GAC7GG 7CAGCTCCAC CC7CCCAG7G CTGCCAGCGC 
GTCAACGCGG AAAGGA7ACA GATACT GACC AGTCGAGG7G GGAGGG7CAC GACGG7CGCG 

S61 AAGGAGGGCG 7TCCC7GA 
T7CCTCCCGC AAGGGACT 



3 Schema 2a: Verbindung mit dcr Scqucnzidcntifikationsnummer 2a 

Dieses Schema zeigt die Aminosauresequenz der humanen 3GnT im Ein-Buchstab encode, 
durch Translation aus der Sequenz gemass Seq ED-Nr. laubersetzt worden ist. 
(l)Seq-ID Nr. 2a. 
(i) Sequenzkennzeichen: 
5 (A) LANGE: 329 Aminosauren 
(B) ART: Polypeptid 



(D) TOPOLOGIE: linear 



40 (ii) ART DES MOLEKLTLS: Polypeptid zu cDNA 

(iii) URSPRGNGLICHE HERKUNFT: 
(A) 0RGAN1SMUS: Homo sapiens 
(D) ENTWICKLUNGS STADIUM: Fotaistadium 
45 (F) GEWEBETYP: Gehirn 
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(vii) UNMTTTELB ARE HERKUNFT: 

(A) BIBLIOTHEK: «>ha S en GenbanJc aus fbulem menschlichen G e him (CLONTECH, Adresse 
5 ieh e oben). durch Translation bei heterologer Expression 

5 

(ix) MERKMAL 

(A) NAME/SCHLUSSEL: Cytoplasmatische Domane 

(B) LAGE: l-ll 

10 

(ix) MERKMAL 

(A) NAME/SCHLUSSEL: Transmembran-Domane 

(B) LAGE: 12-30 

15 

(ix) MERKMAL 

(A) NAME/SCHLUSSEL: Stamm und Katalytische Domane 

(B) LAGE: 31-329 

20 

fix) 

MERKMAL 

(A) NAME/SCHLUSSEL: AT-GlycosyLiemngssteile 

(B) LAGE: Asn 131 

25 

(ix) MERKMAL 

(A) NAME/SCHLUSSEL: Gesamtprotein 

(B) LAGE: 1-329 

30 

n mwttpraWRR RAALGLGTLA LCGAALLYLA RCAAEPGDPR 

.i SrS ^haaafla vlvasapraa errsvirstw 

V; ^pprS WARFAVGTAG LGAEERRALE REQARHGOLL 
^ ^alS ™akvlaml AWLDEHVAFE FVLKADDDSF 
H 1 ^fn^^T RAREPARRRR LYWGFFSGRG RVKPGGRWRE 

35 \t\ «rL«s» 
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241 -DVSLGAWLA PVDVQREHDP RFDTEYRSRG CSNQYLVTHK 

2 81 QSLEDMLEKH ATLAREGRLC KREVQLRLSY VYDWSAPPSQ 

3 21 CCQRREGIP 



Schema 2b: Verbindung mit der Sequenzidentifikationsnummer 2b 

Dieses Schema zeigt die Aminosauresequenz der murinen 3GnT im Ein-Buchstab encode, welche 
durch Translation aus der Sequenz gemass Seq ID-Kr. lb ubersetzt worden ist. 
(l)Seq-IDNr. 2b. 

(i) Sequenzkennzeichen: 

(A) LANGE: 325 Aminosauren 

(B) ART: Polypeptid 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Polypeptid zu cDNA 

(iii) URSPRCNGLICHE HERKUNFT: 
(A) ORGANISMUS: Mus musculus 

(D) ENTWICKLUNGSSTADIUM: Fotalstadium 
(F) GEWEBETYP: Gehirn 

(vii) UNMITTELB ARE HERKUNFT: 

(A) BIBLIOTHEK: >.-Phagen Genbank aus fbtalem murinem Gehirn (Stratagene, Adresse siehe 
oben), durch Translation bei heterologer Expression 

(ix) MERKMAL 

(A) NAME/SCHLUSSEL: Cytoplasmatische Domane 

(B) LAGE: 1-11 

(ix) MERKMAL 
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(A) NAME/SCHLUSSEL: Transmembran-Domane 

(B) LAGE: 12-30 



(ix) MERKMAL 

(A) NAME/SCHLUSSEL: Stamm und katalytische Domane 

(B) LAGE: 31-325 

(ix) MERKMAL 

(A) NAME/SCHLUSSEL: N-Glycosylierungsstelle 

(B) LAGE: Asn 127 

(ix) MERKMAL 

(A) NAME/SCHLUSSEL: Gesamtprotein 

(B) LAGE: 1-325 

1 MKVFRRAWRH RVALGLGGLA FCGTTLLYLA RCASEGETPS 

20 41 ASGAARPRAK AFLAVLVASA PRAVERRTAV RSTWLAPERR 

81 GGPEDVWARF AVGTGGLGSE ERRALELEQA QHGDLLLLPA 

121 LRDAYENLTA KVLAMLTWLD ERVDFEFVLK ADDDSFARLD 

16^ AILVDLRARE PARRRRLYWG FFSGRGRVXF GGRWREAAWQ 

201 LCDYYLPYAL GGGYVLSADL YHYLRLSREY LRAWHSEDVS 

75 241 LGTWLAPVDV QREHDPRFDT EYKSRGCNNQ YLVTHKQSPE 

281 DMLEKQQMLL HEGRLCKHEV QLRLSYVYDW SAPPSQCCQR 

321 KEGVP 



15 



30 Schema 3a 

Dieses Schema zeigt die Aminosauresequenz im Ein-Buchstabencode, welche durch Weglassen 
der cytoplasmatischen und transmembranalen Domanen aus der Sequenz Nr. 2a hervorgeht (Seq 
ED Nr. 3a). 



31 RCAAEPGDPR AMSGRSPPPP APARAAAFLA VLVASAPRAA 

71 ERRSVIRSTW LARRGAPGDV WARFAVGTAG LGAEERRALE 

111 REQARHGDLL LLPALRDAYE NLTAKVLAML AWLDEHVAFE 

151 FVLKADDDSF ARLDALLAEL RAREPARRRR LYWGFF SGRG 

191 RVKPGGRWRE AAWQLCDYYL PYALGGGYVL SADLVHYLRL 

231 SRDYLRAWHS EDVSLGAWLA PVDVQREHDP RFDTEYRSRG 
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271 CSNQYLVTKK QSLEDMLEKH ATLAREGRLC KREVQLRLSY 
311 VYDWSAPPSQ CCQRRSGIP 



5 

Schema 3b 



Di«e S Schema zeigt die Anunosauresequenz im Ein-Buchstabencode, welche durch Weglassen 
der cytoplasmatischen and transmembrane Domanen aus der Sequenz Nr. 2b hervorgeM (Seq 
ID Kr. 3b). 



31 
71 
111 



RCASEGETPS ASGAARPRAK AFLAVLVASA PRAVERRTAV 
RSTWLAPERR GGPEDVWARF AVGTGGLGSE ERRALEL3QA 
QHGDLLLLPA LRDAYEKLTA KVLAMLTWLD ERVDFEFVLK 
151 ADDDSFARLD AILVDLRARE PARRRRLYWG FFSGRGRVXP 

,< III Sreaawq lcdyylpyal gggyvlsadl vhylrlsrey 

15 231 Shsedvs lgtwlapvdv qrehdprfdt eyksrgcnnq 

YLVTHKQSPE DMLEKQQMLL HEGRLCKHEV QLRLiSYVYDW 



271 



311 SAPPSQCCQR KEGVP 
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